استفاده از الگوریتم های دسته بندی و خوشه بندی برای پیش بینی تعداد قرص مصرفی: مورد کاوی بیماری دیابت

نویسندگان

مریم عاشوری

دانشجوی کارشناسی ارشد، مهندسی فن آوری اطلاعات تجارت الکترونیک، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران وجیهه ناجی مقدم

دانشجوی کارشناسی ارشد، مهندسی فن آوری اطلاعات تجارت الکترونیک، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران سمیه علیزاده

استادیار، مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران مهسا صفی

دانشجوی کارشناسی ارشد، مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران

چکیده

مقدمه : امروزه با شیوع بیماری دیابت پیش بینی تعداد قرص مصرفی glibenclamid و metformin روزانه برای بیماران به پزشکان در جهت تشخیص تعداد قرص مصرفی بیمار و همچنین مهار عوارض شدید و خطرناک مصرف بیش از حد دارو کمک می نماید، زیرا میزان نیاز بیماران دیابتی به دارو دارای اهمیت بسیار می باشد. از این رو در پژوهش حاضر به منظور پیش بینی تعداد قرص مصرفی روزانه ی بیماران دیابتی، از تکنیک های داده کاوی استفاده شد. در پایان الگوریتمی که نتیجه ی بهتری در فرآیند ارزیابی بدست می دهد، با توجه به مجموعه داده های تحت بررسی، انتخاب می شود. روش بررسی: مطالعه ی حاضر به روش توصیفی- مقطعی صورت گرفت. نمونه گیری به روش سرشماری بود و تمامی بیماران (2783 بیمار) را در فاصله ی زمانی فروردین 87 تا خرداد 91 در برگرفت. جامعه ی پژوهش متشکل از داده های مرکز تحقیقات دیابت یزد وابسته به دانشگاه علوم پزشکی شهید صدوقی یزد بود و محتوای رکوردها مورد تایید مسؤولین مرکز دیابت قرار گرفت. در مرحله ی پیش پردازش داده ها، با نظر افراد خبره در مراکز تحقیقاتی رکوردهایی که مقادیر برخی فیلدهای آنها خالی بود، حذف شد و تعداد بیماران تحت بررسی به 740 مورد رسید. این یافته ها با مراجعه ی مستقیم پژوهشگر به مرکز تحقیقات دیابت یزد حاصل شده و روایی روش جمع آوری اطلاعات توسط استاد راهنما و متخصصین امر مورد تایید قرار گرفت. با سنجش صحت مجموعه داده های آزمون، میزان پایایی دو الگوریتم مورد استفاده نیز مقایسه شد. در این مطالعه جهت تحلیل داده ها و اجرای الگوریتم های داده کاوی از نرم افزار clementine 12.0 استفاده شد. دو الگوریتم متفاوت از الگوریتم های استنتاج قانون به نام های c5.0 و chaid روی داده ها اعمال گردید و سپس صحت مدل های تولید شده بدست آمد. در نهایت برای تایید صحت مدل های تولید شده از خوشه بندی استفاده گردید. یافته ها: مقادیر به دست آمده برای صحت مدل های ایجاد شده از اجرای الگوریتم های c5.0 و chaid روی مجموعه داده های تحت بررسی 52/45 و 38/28 درصد بود. صحت بالای مدل c5.0 عملکرد بهتر این الگوریتم برای پیش بینی تعداد قرص مصرفی را نشان داد. از طرفی پایین بودن مقدار صحت این مدل نشان دهنده ی این بود که برخی مقادیر به طور صحیح در جای خود دسته بندی نشده اند. بنابراین مقایسه ی مقادیر واقعی و مقادیر پیش بینی شده برای تعداد قرص مصرفی در تولید مدل می تواند بیانگر علل کاهش صحت هر مدل باشد. علت کاهش صحت مدل به مقادیر پیش بینی شده ای وابسته بود که در مقایسه با مقادیر واقعی صحت و ضریب اطمینان پایینی دارند. خوشه بندی نتایج بدست آمده از اجرای الگوریتم c5.0 تعداد قرص مصرفی 3، 5، 6 و 7 با صحت مقدار پیش بینی شده ی به ترتیب 83/46، 36/36، 71/55 و 15 درصد را در یک خوشه قرار داد، زیرا نمونه داده هایی که دارای صحت پایینی در پیش بینی تعداد قرص مصرفی بود و یا تعداد نمونه داده ی کمی داشت، در یک خوشه قرار گرفتند. همچنین خوشه بندی نتایج اجرای الگوریتم chaid نیز تعداد قرص مصرفی 5 با صحت مقدار پیش بینی شده ی 93/20 را در یک خوشه قرار داد. نتیجه گیری: این مقاله حاصل پروژه ی تحقیقاتی گروه داده کاوی دانشگاه خواجه نصیر بود که در نهایت در قالب فعالیت گروهی تکمیل و به صورت پژوهش حاضر درآمد. در مراکز تحقیقات دیابت وجود رویکرد سازمان دهی شده جهت پیش بینی تعداد قرص مصرفی بیمار به منظور کمک به پزشک برای افزایش صحت تشخیص و جلوگیری ازعوارض جانبی ناشی از تشخیص نادرست در تعداد قرص خوراکی ضروری است. با توجه به لزوم استفاده از فن آوری های رایانه ای، اینترنت و نرم افزارهای تحلیلی و به منظور مهار اثرات خطرناک بیماری، بهتر است اقدامات لازم جهت ابداع رویکردهای پیشنهادی با مشاوره ی متخصصان مربوط انجام شود. واژه های کلیدی: دیابت؛ درخت تصمیم؛ دسته بندی؛ خوشه بندی؛ شاخص dunn

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

دسته بندی و پیش بینی وضعیت تحصیلی دانشجویان با استفاده از تکنیک های داده کاوی

داده کاوی و کشف الگوها و دانش نهفته در داده های سیستم های آموزشی کمک شایانی به تصمیم گیرندگان عرصه آموزش عالی جهت بهبود فرآیند های آموزشی نظیر برنامه ریزی، ثبت نام، ارزیابی و مشاوره می نماید. هدف مقاله حاضر، دسته بندی و پیش بینی وضعیت تحصیلی دانشجویان با استفاده از تکنیک های داده کاوی است. در این مقاله سعی شده با استفاده از داده های دموگرافیک و سوابق تحصیلی دانشجویان و آماده سازی مناسب داده ها ...

متن کامل

پیش بینی روش درمان بیماری قلبی با استفاده از الگوریتم های داده کاوی

Background and Aim: Nowadays heart disease is very common and is a major cause of mortality. Proper and early diagnosis of this disease is very important. Diagnostic methods and treatments of the disease are so expensive and have many side effects. Therefore, researchers are looking for cheaper ways to diagnose it with high precision. This study aimed to identify a model for the treatment of he...

متن کامل

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

متن کامل

بررسی میزان تأثیر داروهای درمان ناباروری در بیماران نابارور با استفاده از الگوریتم خوشه بندی و تکنیک های داده کاوی

Background and purpose: The rate of infertility has increased throughout the world. Data mining is a new method for analyzing information from databases. Few studies are done regarding infertility and using data mining in describing and predicting different treatment methods and factors influencing these methods. This paper proposes a model for evaluating the efficacy of different drugs in trea...

متن کامل

ارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2

One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

عنوان ژورنال:

مدیریت اطلاعات سلامت

جلد ۱۰، شماره ۵، صفحات ۷۳۹-۷۴۹

کلمات کلیدی

دیابت درخت تصمیم دسته بندی خوشه بندی شاخص dunn

میزبانی شده توسط پلتفرم ابری doprax.com